人工智能的神经符号方法将神经网络与经典的象征技术结合起来,正在逐渐突出,需要正式的方法来推理其正确性。我们提出了一种新型的建模形式主义,称为神经符号并发随机游戏(NS-CSGS),该游戏包括在共享的连续状态环境中相互作用的概率有限状态的概率有限状态,通过以神经网络实现的感知机制观察到。由于环境状态空间是连续的,因此我们专注于具有Borel状态空间的NS-CSG类。我们考虑了零和折扣累积奖励的问题,并证明了在Borel可测量性和对模型组件的分段限制下NS-CSG的价值的存在。从算法的角度来看,计算CSG的值和最佳策略的现有方法集中在有限状态空间上。我们首次介绍可实施的价值迭代和政策迭代算法,以求解一类无数状态空间CSG,即NS-CSG,并证明其收敛性。我们的方法通过利用基础游戏结构,然后制定NS-CSG的价值函数和策略的分段线性或恒定表示。我们通过将价值迭代的原型实施应用于动态的停车案例研究来说明我们的方法。
translated by 谷歌翻译
We propose Panoptic Lifting, a novel approach for learning panoptic 3D volumetric representations from images of in-the-wild scenes. Once trained, our model can render color images together with 3D-consistent panoptic segmentation from novel viewpoints. Unlike existing approaches which use 3D input directly or indirectly, our method requires only machine-generated 2D panoptic segmentation masks inferred from a pre-trained network. Our core contribution is a panoptic lifting scheme based on a neural field representation that generates a unified and multi-view consistent, 3D panoptic representation of the scene. To account for inconsistencies of 2D instance identifiers across views, we solve a linear assignment with a cost based on the model's current predictions and the machine-generated segmentation masks, thus enabling us to lift 2D instances to 3D in a consistent way. We further propose and ablate contributions that make our method more robust to noisy, machine-generated labels, including test-time augmentations for confidence estimates, segment consistency loss, bounded segmentation fields, and gradient stopping. Experimental results validate our approach on the challenging Hypersim, Replica, and ScanNet datasets, improving by 8.4, 13.8, and 10.6% in scene-level PQ over state of the art.
translated by 谷歌翻译
We introduce DiffRF, a novel approach for 3D radiance field synthesis based on denoising diffusion probabilistic models. While existing diffusion-based methods operate on images, latent codes, or point cloud data, we are the first to directly generate volumetric radiance fields. To this end, we propose a 3D denoising model which directly operates on an explicit voxel grid representation. However, as radiance fields generated from a set of posed images can be ambiguous and contain artifacts, obtaining ground truth radiance field samples is non-trivial. We address this challenge by pairing the denoising formulation with a rendering loss, enabling our model to learn a deviated prior that favours good image quality instead of trying to replicate fitting errors like floating artifacts. In contrast to 2D-diffusion models, our model learns multi-view consistent priors, enabling free-view synthesis and accurate shape generation. Compared to 3D GANs, our diffusion-based approach naturally enables conditional generation such as masked completion or single-view 3D synthesis at inference time.
translated by 谷歌翻译
深度学习的成功导致了包括计算机视觉在内的许多计算机科学领域的快速转变和增长。在这项工作中,我们通过从媒体考古学的角度分析研究论文中的数字和表,通过计算机视觉研究论文本身来研究这种增长的影响。我们通过对涵盖计算机视觉,图形和可视化的资深研究人员的访谈以及十年的视觉会议论文的计算分析进行了调查。我们的分析重点是在广告,衡量和传播日益商品化的“贡献”中发挥作用的要素。我们认为,这些元素中的每一个都由计算机视觉的气候塑造和塑造,最终为该商品化做出了贡献。通过这项工作,我们试图激励有关研究论文设计和更广泛的社会技术出版系统的未来讨论。
translated by 谷歌翻译
强化学习(RL)旨在在给定环境中从奖励功能中训练代理商,但逆增强学习(IRL)试图从观察专家的行为中恢复奖励功能。众所周知,总的来说,各种奖励功能会导致相同的最佳政策,因此,IRL定义不明。但是,(Cao等,2021)表明,如果我们观察到两个或多个具有不同折现因子或在不同环境中起作用的专家,则可以在某些条件下确定奖励功能,直至常数。这项工作首先根据等级条件显示了表格MDP的多位专家的等效可识别性声明,该声明易于验证,也被证明是必要的。然后,我们将结果扩展到各种不同的方案,即,在奖励函数可以表示为给定特征的线性组合,使其更容易解释,或者当我们可以访问近似过渡矩阵时,我们会表征奖励可识别性。即使奖励无法识别,我们也提供了特征的条件,当给定环境中的多个专家的数据允许在新环境中概括和训练最佳代理。在各种数值实验中,我们对奖励可识别性和概括性的理论结果得到了验证。
translated by 谷歌翻译
在离岸部门以及科学界在水下行动方面的迅速发展,水下车辆变得更加复杂。值得注意的是,许多水下任务,包括对海底基础设施的评估,都是在自动水下车辆(AUV)的帮助下进行的。最近在人工智能(AI)方面取得了突破,尤其是深度学习(DL)模型和应用,这些模型和应用在各种领域都广泛使用,包括空中无人驾驶汽车,自动驾驶汽车导航和其他应用。但是,由于难以获得特定应用的水下数据集,它们在水下应用中并不普遍。从这个意义上讲,当前的研究利用DL领域的最新进步来构建从实验室环境中捕获的物品照片产生的定制数据集。通过将收集到的图像与包含水下环境的照片相结合,将生成的对抗网络(GAN)用于将实验室对象数据集转化为水下域。这些发现证明了创建这样的数据集的可行性,因为与现实世界的水下船体船体图像相比,所得图像与真实的水下环境非常相似。因此,水下环境的人工数据集可以克服因对实际水下图像的有限访问而引起的困难,并用于通过水下对象图像分类和检测来增强水下操作。
translated by 谷歌翻译
热分析在不同的温度场景下提供了对电子芯片行为的更深入见解,并可以更快地设计探索。但是,使用FEM或CFD,在芯片上获得详细而准确的热曲线非常耗时。因此,迫切需要加快片上热溶液以解决各种系统方案。在本文中,我们提出了一个热机学习(ML)求解器,以加快芯片的热模拟。热ML-Solver是最近的新型方法CoAemlSim(可组合自动编码器的机器学习模拟器)的扩展,并对溶液算法进行了修改,以处理常数和分布式HTC。在不同情况下,针对商业求解器(例如ANSYS MAPDL)以及最新的ML基线UNET验证了所提出的方法,以证明其增强的准确性,可伸缩性和概括性。
translated by 谷歌翻译
ISO 14971是用于医疗设备风险管理的主要标准。尽管它指定了医疗设备风险管理的要求,但并未指定执行风险管理的特定方法。因此,医疗设备制造商可以自由开发或使用任何适当的方法来管理医疗设备的风险。最常用的方法,例如故障树分析(FTA),无法为计算风险估计有限或没有可用的历史数据或数据对数据存在二阶不确定性时提供合理的依据。在本文中,我们使用混合贝叶斯网络(BNS)提出了一种新颖的医疗设备风险管理方法,该方法解决了经典方法(例如FTA)的局限性,并结合了影响医疗设备风险的相关因素。提出的BN方法是通用的,但可以按系统的基础进行实例化,我们将其应用于除颤器设备,以证明生产和后期生产过程中医疗设备风险管理所涉及的过程。该示例已根据现实世界数据进行验证。
translated by 谷歌翻译
为公平的ML问题引入了许多方法,其中大多数是复杂的,其中许多方法非常针对基础ML Moethodology。在这里,我们介绍了一种简单,易于解释的新方法,并可能适用于许多标准ML算法。显式降级功能(EDF)降低了敏感变量代理之间每个功能的影响,从而使每个此类功能应用了不同量的降级。用户指定脱水超标仪,以达到实用性/公平性权衡频谱中的给定点。我们还引入了一个新的简单标准,用于评估任何公平ML方法提供的保护程度。
translated by 谷歌翻译
可以使用X射线自由电子激光器的强脉冲和短脉冲直接通过单次相干衍射成像直接观察到自由飞行中孤立的纳米样品的结构和动力学。广角散射图像甚至编码样品的三维形态信息,但是该信息的检索仍然是一个挑战。到目前为止,只有通过与高度约束模型拟合,需要对单镜头实现有效的三维形态重建,这需要有关可能的几何形状的先验知识。在这里,我们提出了一种更通用的成像方法。依赖于允许凸多面体描述的任何样品形态的模型,我们从单个银纳米颗粒中重建广角衍射模式。除了具有高对称性的已知结构动机外,我们还检索了以前无法访问的不完美形状和聚集物。我们的结果为单个纳米颗粒的真实3D结构确定以及最终的超快纳米级动力学的3D电影开辟了新的途径。
translated by 谷歌翻译